准备笔试 & NLP基础

  |     |  
阅读次数:
  1. 图像基础复习:
    ①:相机模型参数,相机畸变系数及矫正;相机模型参数分为内参与外参,内参有焦距f、像素宽度dx和像素高度dy、相机主点u0、v0,外参有R和T。畸变分为径向畸变(桶型、枕型)和切向畸变,前者有k1、k2、k3、k4 4个系数,后者有p1、p2 2个系数。矫正公式略。
    ②:常用边缘检测算子,一阶算子:Sobel、Prewitt、Robert、canny;二阶算子:Laplacian,对噪声敏感。Sobel和Prewitt只是权值不同,效果上,Sobel要由于Prewitt,Robert是使用对角差分。其中canny是阶段性算法,分为3个阶段滤波、增强、检测,效果最好。
  2. NLP基础:
    ①:学习了Word Embedding,它包含了词与词之间的关系,将一个词用一定维度的向量来表示,作为网络的输入。
    ②:如何训练Word Embedding,通常采用context-target pairs的方法,Context的选定有:Last 4 words、4 words on left & right、Last 1 word、Nearby 1 word,通过这种方式来构造监督学习的样本。现成的方案有基于CBOW 的 Word2Vec方法和基于Skip-Gram的Word2Vec方法,CBOW方案是使用周围的词来预测中间的词,Skip-Gram是使用中间的词来预测周围的词,Skip-Gram使用的要多一点。但Skip-Gram中使用softmax进行分类,针对大数据集,softmax的分母计算较耗时,所以出现了层级softmax(二叉树)、Negative Sampling(使用1个正样本,k个负样本来组成一次迭代的样本)。
    ③:GloVe:比较简单的Word Embedding方法,通过对一个公式求最小化的参数即可。
    ④:用RNN来做情感分类,首先下载已经训练好的Word Embedding,然后将分词的结果通过Word Embedding转换为词向量,再通过搭建好的RNN来进行做情感分类。

当前网速较慢或者你使用的浏览器不支持博客特定功能,请尝试刷新或换用Chrome、Firefox等现代浏览器